标签: Coding Agent
2 篇文章
-
Agentic RL:一篇大综述告诉你 RL 怎么把 Agent 从写死的脚本变成自适应系统
25 位作者、500 篇参考文献、TMLR 发表。这篇 survey 形式化了从 LLM RL(RLHF/DPO)到 Agentic RL 的范式转变,并给出了以能力维度和任务域两条轴线的完整分类法。我们翻译并解读了核心框架和与 Coding Agent 最相关的部分。
-
SWE-bench Verified 30 个月:从 1.96% 到 80.9%,Coding Agent 是怎么做到的
30 个月,从 1/50 到 4/5。本文翻译并解读 AgentMarketCap 的 SWE-bench Verified 完整演进史,拆解每个跳变的驱动因子,以及在 saturation 之后该看什么。